iT邦幫忙

2025 iThome 鐵人賽

DAY 8
0
AI & Data

AI初學者入門系列 第 8

Day8 Chroma 向量資料庫

  • 分享至 

  • xImage
  •  

什麼是向量資料庫呢?
可以把文字變成數字儲存起來的地方。也就是把人類的語言轉換成數字,好讓電腦理解。

為什麼要用Chroma?
它是個一個常見的向量資料庫,還有FAISS (Meta)、Weaviate……等。

在開發 AI 應用,特別是 RAG(檢索增強生成)架構時,向量資料庫就扮演了關鍵的角色: 儲存經向量化的資料,並進行語意相似度檢索。

我來介紹Chroma如何使用:

  1. 安裝 pip install chromadb,可用於本地端

  2. 建立PersistentClient(這是新版用法)
    https://ithelp.ithome.com.tw/upload/images/20250810/20177905r9eUjXuKVj.png

  3. 建立 collection: 所有的資料都放在裡面
    新建兩個文件和文本訊息
    https://ithelp.ithome.com.tw/upload/images/20250810/20177905KAVrW4tYzW.png

  4. 以”AI” 這關鍵詞去搜尋,查詢語意最相似的文件
    https://ithelp.ithome.com.tw/upload/images/20250810/20177905xukJXW6HlW.png

就是最後輸出的樣子
https://ithelp.ithome.com.tw/upload/images/20250810/20177905cK3S5DwYZO.png

代表已經找到在文件 ID 為 "doc1"、文件為’AI的應用很廣'、metadatas為'source': 'A'的地方

是不是很簡單呢?
明天會介紹rag~~


上一篇
Day7 介紹FAISS 並儲存查詢
下一篇
Day9 Retrival-Augmented Generation (RAG)、微調(Fine-tuning)
系列文
AI初學者入門30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言